# test04_set.py
# 假设有两个日志文件a.txt和b.txt，文件中有大量重复的内容
# 取出只有b日志文件中存在的行
# 读取a日志，获取所有的行
with open('a.txt', mode='r') as fr1:
    logs1 = fr1.readlines()
    # print(logs1)
# 读取b日志，获取所有的行
with open('b.txt', mode='r') as fr2:
    logs2 = fr2.readlines()
    # print(logs2)
# 将a日志所有的行转为集合
set1 = set(logs1)
# 将b日志所有的行转为集合
set2 = set(logs2)
# print(set1)
# print(set2)
# 求差集，获取b日志所有行
result = set2 - set1
# print(result)
# 转为列表
print(list(result))
